home *** CD-ROM | disk | FTP | other *** search
/ MacWorld 1999 March - Disc 1 / Macworld (1999-03) (Disk 1).dmg / Shareware World / Utilities / Text Processing / Alpha / Tcl / SystemCode / textFill.tcl < prev    next >
Encoding:
Text File  |  1998-11-21  |  13.6 KB  |  468 lines  |  [TEXT/ALFA]

  1. ####################################################################
  2. # Much by Vince Darley.
  3. #                                    created: 26/11/96 {7:08:34 pm} 
  4. #                                last update: 16/5/96 
  5. #  Author: Vince Darley
  6. #  E-mail: <mailto:vince@das.harvard.edu>
  7. #    mail: Division of Applied Sciences, Harvard University
  8. #          Oxford Street, Cambridge MA 02138, USA
  9. #     www: <http://www.fas.harvard.edu/~darley/>
  10. #  
  11. ####################################################################
  12.  
  13. ## 
  14.  # Here's a    brief explanation of the smart fillParagraph routines
  15.  # 
  16.  # 'fillParagraph'
  17.  #       If there's a    selection, then    fill all paragraphs    in that
  18.  #       selection. If not then fill the paragraph surrounding the
  19.  #       insertion point.    The    definition of a    'paragraph'    may    be
  20.  #       mode    dependent (see paraStart, paraFinish)
  21.  #       
  22.  # 'fillOneParagraph'
  23.  #       Fills the single    paragraph surrounding the insertion    point.
  24.  #       If called with parameter    '0', it    doesn't    bother to remember
  25.  #       where the insertion point was, which    makes multiple paragraph
  26.  #       fills quicker when called by    'fillParagraph'
  27.  #       
  28.  # 'rememberWhereYouAre'
  29.  #       Given the start of a    paragraph and the point    to remember,
  30.  #       this    creates    a record stored    in '__g_remember_pos' so that
  31.  #       the following function can find that    spot later,    even after
  32.  #       the paragraph has had space/tabs/new-lines meddled with.
  33.  #       
  34.  # 'goBackToWhereYouWere'
  35.  #       Given the beginning and end of a    selection, where the beginning
  36.  #       corresponds to a    previous call of 'rememberWhereYouAre',    this
  37.  #       procedure will move the insertion point to the correct place.
  38.  #       
  39.  # 'texParaCommands'
  40.  #       A variable containing the bulk of a regexp for paragraph
  41.  #       indicators in 'TeX' mode.
  42.  #       
  43.  # 'paraStart'
  44.  #       Finds the start of the paragraph    containing the insertion point.
  45.  #       
  46.  # 'paraFinish'
  47.  #       Finds the end of    the    paragraph containing the insertion point.
  48.  ##
  49.     
  50. proc fillParagraph {} {
  51.     if {[pos::compare [getPos] == [selEnd]]} {
  52.     fillOneParagraph
  53.     } else {    
  54.     set start [getPos]
  55.     set end [selEnd]
  56.     set p $start
  57.     while {[pos::compare $p < $end] && [pos::compare $p < [maxPos]]} {
  58.         goto $p
  59.         set p [fillOneParagraph 0]
  60.     }
  61.     goto $start
  62.     }
  63. }
  64.  
  65. proc rememberWhereYouAre { startPara pos } {
  66.     global __g_remember_str
  67.     if {[pos::compare [pos::math $pos - 20] < $startPara]} {
  68.     set srem $startPara
  69.     } else {
  70.     set srem [pos::math $pos - 20]
  71.     }
  72.     set __g_remember_str [quote::Regfind [getText $srem $pos]]
  73.     regsub -all "\[ \t\r\n\]+" $__g_remember_str {[ \t\r\n]+} __g_remember_str
  74. }
  75.  
  76. proc goBackToWhereYouWere { start end } {
  77.     global __g_remember_str
  78.     if { $__g_remember_str != "" } {
  79.     regexp -indices ".*(${__g_remember_str}).*" [getText $start $end] "" submatch
  80.     set p [expr {[info exists submatch] ? \
  81.       [pos::math $start + [expr {1 + [lindex $submatch 1]}]] : $end}]
  82.     goto [expr {[pos::compare $p >= $end] ? [pos::math $end - 1] : $p}]
  83.     } else {
  84.     goto $start
  85.     }
  86. }
  87.  
  88. ## 
  89.  # -------------------------------------------------------------------------
  90.  #     
  91.  #    "getLeadingIndent" --
  92.  #    
  93.  #     Find the indentation of the line containing 'pos',    and    convert    it
  94.  #     to    a minimal form of tabs followed    by spaces.    If 'size'
  95.  #     is    given, then    the    variable of    that name is set to    the    length of
  96.  #     the indent. Similarly 'halftab' can be set to half a tab.
  97.  # -------------------------------------------------------------------------
  98.  ##
  99. proc getLeadingIndent { pos {size ""} {halftab ""} } {
  100.     # get the leading whitespace of the current line
  101.     set res [search -s -n -f 1 -r 1 "^\[ \t\]*" [lineStart $pos]]
  102.     
  103.     # convert it to minimal form: tabs then spaces, stored in 'front'
  104.     getWinInfo a
  105.     set sp [string range "              " 1 $a(tabsize) ]
  106.     regsub -all "($sp| +\t)" [eval getText $res] "\t" front
  107.     if { $size != "" } {
  108.     upvar $size ind
  109.     # get the length of the indent
  110.     regsub -all "\t" $front $sp lfront
  111.     set ind [string length $lfront]
  112.     }
  113.     if { $halftab != "" } {
  114.     upvar $halftab ht
  115.     # get the length of half a tab
  116.     set ht [string range "            " 1 [expr {$a(tabsize)/2}]]
  117.     }
  118.     
  119.     return $front
  120. }
  121.  
  122. ## 
  123.  # -------------------------------------------------------------------------
  124.  # 
  125.  # "fillOneParagraph" --
  126.  # 
  127.  #  Fixes: won't put a double-space after abbreviations like 'e.g.', 'i.e.'
  128.  #  
  129.  #  Works around the Alpha 'replaceText' bug.
  130.  # -------------------------------------------------------------------------
  131.  ##
  132. proc fillOneParagraph {{remember 1}} {
  133.     global leftFillColumn fillColumn doubleSpaces
  134.  
  135.     set pos [getPos]
  136.     
  137.     set start [paraStart $pos] 
  138.     set end [paraFinish $pos]
  139.     if {$remember} { rememberWhereYouAre $start $pos }
  140.     
  141.     # Get the leading whitespace of the current line and store length in 'left'
  142.     set front [getLeadingIndent $pos left]
  143.     # fill the text
  144.     regsub -all "\[ \t\r\n\]+" [string trim [getText $start $end]] " " text
  145.     # turn single spaces at end of sentences into double
  146.     if {$doubleSpaces} {regsub -all {(([^.][a-z]|[^a-zA-Z@]|\\@)[.?!]("|'|'')?([])])?) } $text {\1  } text}
  147.     #     if {$doubleSpaces} {regsub -all {(([^A-Z@]|\\@)[.?!][])'"]?) } $text {\1  } text}
  148.  
  149.     # temporarily adjust the fillColumns
  150.     set ol $leftFillColumn
  151.     set or $fillColumn
  152.     set leftFillColumn 0
  153.     set fillColumn [expr {$fillColumn - $left}]
  154.         
  155.     # break and indent the paragraph
  156.     regsub -all "\r" "\r[string trimright [breakIntoLines $text]]" "\r${front}" text
  157.     # reset columns
  158.     set leftFillColumn $ol
  159.     set fillColumn  $or
  160.     
  161.     # don't replace if nothing's changed
  162.     if { "$text\r" != "\r[getText $start $end]" } {
  163.     # workaround an alpha bug
  164.     if {$remember} { 
  165.         getWinInfo a
  166.         if {[pos::compare [rowColToPos $a(currline) 0] > $start]} { goto $start }
  167.     }
  168.     replaceText $start $end "[string range $text 1 end]\r"
  169.     if {$remember} {
  170.         goBackToWhereYouWere $start [pos::math $start + [string length $text]] 
  171.     }
  172.     }
  173.     
  174.     # in case we wish to fill a region
  175.     return $end
  176. }
  177.  
  178.  
  179. ## 
  180.  # -------------------------------------------------------------------------
  181.  # 
  182.  #    "paraStart"    -- "paraFinish"
  183.  # 
  184.  #     Newly simplified version with fewer regexp    '()' pairs.    Also I think
  185.  #     it    deals better with TeX comments than    the    old    regexp.
  186.  #     
  187.  #     "Start": It's pretty clear    for    non    TeX    modes how this works.  The only    
  188.  #     key is    that we    start at the beginning of the current line and look    back.  
  189.  #     We    then have a    quick check    for    whether    we found that very beginning (in 
  190.  #     which case    return it) or if not (in which case we have found the end of 
  191.  #     the previous paragraph) we move forward a line.
  192.  # 
  193.  #     "Finish": The only    addition is    the    need for an    additional check for
  194.  #     stuff which explicitly    ends lines.
  195.  #       
  196.  #    Results:
  197.  #     The start/finish position of the paragraph containing the given 'pos'
  198.  # 
  199.  # --Version--Author------------------Changes-------------------------------
  200.  #      1.1      <darley@fas.harvard.edu> Cut down on '()' pairs
  201.  #    1.2     Vince - March '96          Better filling for TeX tables ('hline')
  202.  #    1.3     Johan Linde - May '96   Now sensitive to HTML elements
  203.  #    1.4     <darley@fas.harvard.edu> Handle Tcl lists, top of file fix.
  204.  # -------------------------------------------------------------------------
  205.  ##
  206. proc paraStart {pos} {
  207.     global mode 
  208.     global ${mode}::startPara
  209.     if {[pos::compare $pos == [maxPos]]} {set pos [pos::math $pos - 1]}
  210.     set pos [lineStart $pos]
  211.     if {[info exists ${mode}::startPara]} {
  212.     set startPara [set ${mode}::startPara]
  213.     } else {
  214.     switch -- $mode {
  215.         "TeX" -
  216.         "Bib" {
  217.         global texParaCommands
  218.         set startPara {^[ \t]*$|\\\\[ \t]*$|(^|[^\\])%|\\h+line[ \t]*$|\$\$[ \t]*$|^[ \t]*(\\(}
  219.         append startPara $texParaCommands {)(\[.*\]|\{.*\}|•)*[ \t]*)+$}
  220.         } 
  221.         "HTML" {
  222.         global htmlParaCommands
  223.         set startPara {^[ \t]*$|</?(}
  224.         append startPara $htmlParaCommands {)([ \t\r]+[^>]*>|>)}
  225.         }
  226.         default {
  227.         set startPara {^([ \t]*|([\\%].*))$}
  228.         }
  229.     }
  230.     }
  231.  
  232.     set res [search -s -n -f 0 -r 1 -l [minPos] -- "$startPara" $pos]
  233.     if {![string length $res] || $res == "0 0" } {
  234.     # bug work-around.  Alpha fails to match '^' with start of file.
  235.     return [lineStart [lindex [search -s -f 1 -r 1 "\[^ \t\r\n\]" [minPos]] 0]]
  236.     } elseif { [lindex $res 0] == $pos } {
  237.     return $pos
  238.     } else {
  239.     return [nextLineStart [lindex $res 0]]
  240.     }
  241.     
  242. }
  243.  
  244. proc paraFinish {pos} {
  245.     global mode
  246.     global ${mode}::endPara
  247.     set pos [lineStart $pos]
  248.     set end [maxPos]
  249.     if {[info exists ${mode}::endPara]} {
  250.     set endPara [set ${mode}::endPara]
  251.     } else {
  252.     switch -- $mode {
  253.         "TeX" -
  254.         "Bib" {
  255.         global texParaCommands
  256.         set endPara {^[ \t]*$|(^|[^\\])%|\$\$[ \t]*$|^[ \t]*(\\(}
  257.         append endPara $texParaCommands {)(\[.*\]|\{.*\}|•)*[ \t]*)+$}
  258.         } 
  259.         "HTML" {
  260.         global htmlParaCommands
  261.         set endPara {^[ \t]*$|</?(}
  262.         append endPara $htmlParaCommands {)([ \t\r\n]+[^>]*>|>)}
  263.         }
  264.         default {
  265.         set endPara {^([ \t]*|([\\%].*))$}
  266.         }
  267.     }
  268.     }
  269.     
  270.     set res [search -s -n -f 1 -r 1 -l $end -- "$endPara" $pos]
  271.     if {![string length $res]} {return $end}
  272.     set cpos [lineStart [lindex $res 0] ]
  273.     if {[pos::compare $cpos == $pos]} {
  274.     return [nextLineStart $cpos]
  275.     }
  276.     # A line which ends in '\\', '%...', '\hline', '\hhline'
  277.     # signifies the end of the current paragraph in TeX mode
  278.     # (the above checked for beginning of the next paragraph).
  279.     if { $mode == "TeX" || $mode == "Bib" } {
  280.     set res2 [search -s -n -f 1 -r 1 -l $end {((\\\\|\\h+line)[ \t]*|[^\\]%.*)$} $pos]
  281.     if {[string length $res2]} {
  282.         if {[pos::compare [lindex $res2 0] < $cpos] } {
  283.         return [nextLineStart [lindex $res2 0]]
  284.         }
  285.     }
  286.     }
  287.  
  288.     return $cpos
  289.     
  290. }
  291.  
  292. proc selectParagraph {} {
  293.     set pos [getPos]
  294.     set start [paraStart $pos] 
  295.     set finish [paraFinish $pos]
  296.     goto $start
  297.     select $start $finish
  298. }
  299.  
  300. proc sentenceParagraph {} {
  301.     set pos [getPos]
  302.     set start [paraStart $pos] 
  303.     set finish [paraFinish $pos]
  304.  
  305.     set t [string trim [getText $start $finish]]
  306.     set period [regexp {\.$} $t]
  307.     regsub -all "\[ \t\r\]+" $t " " text
  308.     regsub -all {\. } $text "Δ" text
  309.     set result ""
  310.     foreach line [split [string trimright $text {.}] "Δ"] {
  311.         if {[string length $line]} {
  312.             append result [breakIntoLines $line] ".\r"
  313.         }
  314.     }
  315.     if {!$period && [regexp {\.\r} $result]} {
  316.         set result [string trimright $result ".\r"]
  317.         append result "\r"
  318.     }
  319.     if {$result != [getText $start $finish]} {
  320.         replaceText $start $finish $result
  321.     }
  322.     goto $pos
  323. }
  324.  
  325. proc getEndpts {} {
  326.     if {[pos::compare [getPos] == [selEnd]]} {
  327.     set start [getPos]
  328.     set finish [getMark]
  329.     if {[pos::compare $start > $finish]} {
  330.         set temp $start
  331.         set start $finish
  332.         set finish $temp
  333.     }
  334.     } else {
  335.     set start [getPos]
  336.     set finish [selEnd]
  337.     }
  338.     return [list $start $finish]
  339. }
  340.  
  341.  
  342. proc fillRegion {} {
  343.     global leftFillColumn
  344.     set ends [getEndpts]
  345.     set start [lineStart [lindex $ends 0]]
  346.     set finish [lindex $ends 1]
  347.     goto $start
  348.     set text [fillText $start $finish]
  349.     replaceText $start $finish [format "%$leftFillColumn\s" ""] $text "\r"
  350. }
  351.     
  352. proc wrapParagraph {} {
  353.     set pos [getPos]
  354.     set start [paraStart $pos] 
  355.     set finish [paraFinish $pos]
  356.     goto $start
  357.     wrapText $start $finish
  358.     goto $pos
  359. }
  360.  
  361. proc wrapRegion {} {
  362.     set ends [getEndpts]
  363.     set start [lineStart [lindex $ends 0]]
  364.     set finish [lindex $ends 1]
  365.     if {[pos::compare $start == $finish]} {
  366.     set finish [maxPos]
  367.     }
  368.     wrapText $start $finish
  369. }
  370.     
  371.  
  372.  
  373. # Remove text from window, transform, and insert back into window.
  374. proc fillText {from to} {
  375.     global doubleSpaces
  376.     set text [getText $from $to]
  377.     regexp {^ *} $text front
  378.     set text [string trim $text]
  379.     regsub -all "\[ \t\n\r\]+" $text " " text
  380.     if {$doubleSpaces} {regsub -all {(\.|\?|\!) } $text {\1  } text}
  381.     regsub -all "\[\r\n\]" [string trimright [breakIntoLines $text]] "\r${front}" text
  382.     return $front$text
  383. }
  384.  
  385. proc paragraphToLine {} {
  386.     global fillColumn
  387.     global leftFillColumn
  388.     set fc $fillColumn
  389.     set lc $leftFillColumn
  390.     set fillColumn 10000
  391.     set leftFillColumn 0
  392.     fillRegion
  393.     set fillColumn $fc
  394.     set leftFillColumn $lc
  395. }
  396.  
  397. proc lineToParagraph {} {
  398.     global fillColumn
  399.     global leftFillColumn
  400.     set fc $fillColumn
  401.     set fillColumn 75
  402.     set lc $leftFillColumn
  403.     set leftFillColumn 0
  404.     fillRegion
  405.     set fillColumn $fc
  406.     set leftFillColumn $lc
  407. }
  408.  
  409.  
  410. #set sentEnd {[.!?](\r|\n| +)}
  411. set sentEnd {(\r\r|\n\n|[.!?](\r|\n| +))}
  412. set sentBeg {[\r\n ][A-Z]}
  413.  
  414. proc nextSentence {} {
  415.     global sentBeg sentEnd
  416.     if {![catch {search -s -f 1 -r 1 $sentEnd [getPos]} mtch]} {
  417.     if {![catch {search -s -f 1 -r 1 -i 0 $sentBeg [pos::math [lindex $mtch 1] - 1]} mtch]} {
  418.         goto [pos::math [lindex $mtch 0] + 1]
  419.     }
  420.     }
  421. }
  422.  
  423.  
  424. proc prevSentence {} {
  425.     global sentBeg sentEnd
  426.     if {[catch {search -s -f 0 -r 1 $sentBeg [pos::math [getPos] - 2]} mtch]} return
  427.     if {![catch {search -s -f 0 -r 1 $sentEnd [lindex $mtch 1]} mtch]} {
  428.     if {![catch {search -s -f 1 -r 1 -i 0 $sentBeg [pos::math [lindex $mtch 1] - 1]} mtch]} {
  429.         goto [pos::math [lindex $mtch 0] + 1]
  430.     }
  431.     }
  432. }
  433.  
  434. #===============================================================================
  435. # Called by Alpha to do "soft wrapping"
  436. proc softProc {pos start next} {
  437.     global leftFillColumn
  438.     goto $start
  439.     set finish [paraFinish $start]
  440.     set text [fillText $start $finish]
  441.     if {"${text}\r" != [getText $start $finish]} {
  442.     replaceText $start $finish [format "%$leftFillColumn\s" ""] $text "\r"
  443.     return 1
  444.     } else {
  445.     return 0
  446.     }
  447. }
  448.  
  449. proc dividingLine {} {
  450.     global mode
  451.     global ${mode}modeVars
  452.     if {[info exists ${mode}modeVars(prefixString)]} {
  453.     set a [string trim [set ${mode}modeVars(prefixString)]]
  454.     } else {
  455.     set a "#"
  456.     }
  457.     insertText "${a}===============================================================================\r"
  458. }
  459.  
  460.  
  461.  
  462.  
  463.  
  464.  
  465.  
  466.